TOP 3
자치구 총생활인구수
16 송파구 753278.4966
0 강남구 633521.1274
3 강서구 533814.0426
“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

출처: 서울시 공공데이터포털 (https://data.seoul.go.kr/)
TOP 3
자치구 총생활인구수
16 송파구 753278.4966
0 강남구 633521.1274
3 강서구 533814.0426
TOP 3
자치구 1인가구수
4 관악구 150745
3 강서구 104509
16 송파구 87140
자치구
강남구 7007
관악구 5366
서초구 5060
Name: count, dtype: int64
자치구
강남구 1713
용산구 1421
구로구 1372
Name: count, dtype: int64
안전벨과 CCTV의 상관관계: 0.3032
예상과 달리, CCTV와 안전벨의 상관관계가 높지 않다.
치안센터와 경찰관 수의 상관관계: 0.6500
다른 변수들과 비교했을 때 가장 높은 상관관계를 보임
자치구 술집 수
17 양천구 3094
7 금천구 3179
10 동작구 3276
자치구 술집 수
12 서대문구 3578
7 금천구 3179
14 성동구 4001
술집 수와 총 범죄 건수의 상관계수: 0.8354
다른 변수들과 비교했을 때, 가장 높은 상관관계를 보임
상관계수 분석
<<<<<<< HEAD
범죄건수 주요 변수

상관 관계 높은 변수 임의 선택

VS Stepwise로 변수 선택
서울시 치안 기준 군집화
상관계수가 높은 변수를 활용해서,
비슷한 치안 특성을 가진 구를 찾기위해
저희는 K-Means 클러스터링을 사용했습니다.

K-Means 클러스터링이란?
유사한 특성을 가진 데이터를 자동으로 그룹으로 묶는 비지도 학습 기법
사용자가 군집 개수(K)를 정하면,
K개의 중심점을 기준으로 데이터를 그룹화하고,
각 데이터를 가장 가까운 중심점에 할당합니다.
중심점을 반복적으로 조정하며 유사한 데이터끼리 묶는 군집을 만듭니다.
서울시 자치구별 ‘구별_경찰수’, ‘유흥업소_개수’, ‘총생활인구수’, ‘cctv’ 등을 기준으로 치안 특성이 비슷한 지역을 자동으로 군집화하기 위해 사용했습니다.

하지만 분석 결과는…?

군집 개수를 2개로 설정
군집1
['강남구' '강서구' '마포구' '서초구' '송파구' '영등포구' '종로구' '중구']
군집2
['강동구' '강북구' '관악구' '광진구' '구로구' '금천구' '노원구' '도봉구' '동대문구' '동작구' '서대문구' '성동구'
'성북구' '양천구' '용산구' '은평구' '중랑구']

군집간 총 범죄건수의 평균에 차이가 있다.
| 군집 | 총경찰수 | 파출소수 | 음식점수 | 총인구수 | 총범죄수 |
|---|---|---|---|---|---|
| 1 | 1058.38 | 7468.25 | 464,404.93 | 12.38 | 9337.38 |
| 2 | 734.65 | 3824.71 | 377,246.14 | 8.41 | 5867.06 |

군집간 총 범죄건수의 평균에 차이가 있다.
분석 결과가 유효하다.